STATISTICA COMPUTAZIONALE E MODELLI PREDITTIVI

Prof. Cesare Furlanello

Anno Accademico 2001/2002

OBBIETTIVI DEL CORSO

Obiettivo del corso è sviluppare competenze statistiche e padronanza degli strumenti informatici (linguaggi di programmazione per la manipolazione e l’analisi dei dati) necessari per analizzare dati complessi ed impostare la costruzione di modelli descrittivi e predittivi. Sarà in particolare sviluppata la capacità di esplorare la struttura dei dati, proporre e validare modelli di regressione e classificazione affrontando problemi pratici ed analizzando dati reali. Il corso presuppone una conoscenza dei fondamenti di statistica e prevede esercitazioni al computer.

CONTENUTI DEL CORSO

1. Elementi di programmazione con i linguaggi della famiglia S (S-Plus e R).

2. Modelli predittivi. Terminologia e principi di modelli statistici, apprendimento supervisionato e approssimazione funzionale in classificazione e regressione. Strategie generali per la costruzione di modelli predittivi da dati reali. Visualizzazione della struttura dei dati e costruzione iterativa di modelli. Elementi di selezione dei modelli. Esempi applicativi.

3. Modelli computazionali per il data mining statistico. Modelli additivi. Alberi di classificazione, alberi di regressione. Modello bump hunting. Analisi di importanza delle variabili. Esempi applicativi.

4. Mappe predittive: modelli di regressione e classificazione di dati biologico-ambientali in sistemi di informazione geografica (GIS). Statistica computazionale e modelli predittivi in ambiente GIS. Introduzione al sistema GRASS. Esempi di applicazione a dati del Sistema Informativo Ambiente e Territorio del Trentino.

Modalità d'esame

L’esame consisterà nello sviluppo di un progetto.

Testi di riferimento